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@ Mustererkennungsverfahren 

(57) Fur ein Mustererkennungsverfahren auf der Basis von 
Hidden-Markov-Modellen wtrd vorgeschlagen, bei der 
Transformation der Merkmalsvektoren in Symbolvekto- 
ren anstelle der gebrauchlichen teil-kontinuierlichen Vek- 
torquantisierer mit angenommener statistischer Vertei- 
lungsfunktion einen Polynom-Klassifikator als Vektor- 
quantisierer einzusetzen, der die tatsachtiche Verteilung 
im Merkmalsvektor-Raum besser annahert und zu einer 
deutlichen Reduktion der Fehlerrate des Erkennungssy- 
stems fiihrt. 
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Beschreibung 

Die Erfindung betrifft ein Mustererkennungsverfahren 
nach dem OberbegrifF des Paten tanspruchs 1. 

Fur Mustererkennungsverfahren, insbesondere zur Er- 5 
kennung von Sprache oder von Schrift sind seit langerem 
bevorzugt Erkennungssysteme auf der Basis von Hidden- 
Markov-Modellen im Einsatz, siehe beispielsweise [KCGM 
93]. Bei derartigen Erkennungs-Systemen werden von Priif- 
objekten rnehrdimensionale Merkmaisvektoren gewonnen to 
und auf Symbole eines mehrdimensionalen Symbolvekto- 
raumes abgebildet. Die Liste dieser Symbole, die verschie- 
denen Zustanden des zugrunde gelegten HMM-Modells zu- 
geordnet sind, wird als Codebook bezeichnet. Diese Sym- 
bole konnen wiederum als Koeftizienten eines mehrdimen- 15 
sionalen Symbol vektors aufgefaBt werden. 

Fur die Transformation der Merkmaisvektoren in den 
Symbolvektorraum, die als Vektorquantisierung bezeichnet 
wird, wird prinzipiell zwischen konunuierlichen, teilkonti- 
nuierlichen und diskreten Modellen unterschieden. Die kon- 20 
tinuierlichen Modelle kommen wegen des damit verbunde- 
nen Verarbeitungsaufwands in den meisten Fallen nicht in 
Betracht. 

Bei dem diskreten Modell findet eine sogenannte harte 
Entscheidung bei der Zuordnung eines Merkmalsvektors zu 25 
einem Symbol statt. Dem gegeniiber wird bei den teil-konti- 
nuierlichen Modellen ein Merkmalsvektor mehreren Sym- 
bolen mit im Regelfall unterschiedlicher Gewichtung zuge- 
ordnet. Fiir die Bestimmung dieser Gewichte wird beispiels- 
weise fur die Cluster im zustandsabhangigen Merkmalsvek- 30 
tor-Raum eine statistische Verteilung, insbesondere eine 
Gauss- oder eine Gamma- Verteilung, angenommen. Die 
teil-kontinuierlichen Modelle zeigen im allgemeinen eine 
wesentlich bessere Erkennungsrate als die diskreten Mo- 
delle. 35 

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, 
die Erkennungsleistung eines Mustererkennungsverfahrens 
dieser Art weiter zu verbessem, ohne den Aufwand bei der 
Erkennung nennenswert zu steigern. 

Die Erfindung ist im Patentanspruch 1 beschrieben. Die 40 
UnLeranspriiche enthalten vorteilhafte Ausgestaltungen und 
Weiterbildungen der Erfindung. 

Die Erfindung geht von der Erkenntnis aus, daB die bei 
ublichen teil-kontinuierlichen Modellen angenommene sta- 
tistische Verteilung die tatsachliche Verteilung der Merk- 45 
malsvektoren im zustandsabhangigen Vektorraum haufig 
nur sehr unbefriedigend beschreibt. Demgegeniiber wird bei 
der vorliegenden Erfindung keinerlei Annahme uber eine 
bestimmte Verteilungsfunktion gemacht, sondem es werden 
aus reprasentativen Trainingsdaten die Koeffizienten eines 50 
Polynom-Klassifikators bestimmt, welcher bei der Vektor- 
quantisierung eine wesentlich genauere Approximation an 
die tatsachlich vorliegende Verteilung im Vektorraum dar- 
stellt. 

In einer vorteilhaften Ausfuhrungsform wird der Poly- 55 
nom-Klassifikator mit Momenten-Matrizen irainiert, die 
auch bei einem Training der HMM-Modelle anfallen. Die 
Vektorquantisierung erfolgt vorzugsweise mehrstufig ver- 
zweigt in der Art, daB mehrere Polynom-Teil-Klassifikato- 
ren vorgesehen sind, welche die Knoten der Verzweigung 60 
darstellen und in einer baumartigen Verzweigung angeord- 
net sind, was gegeniiber einem einzigen Klassifikator den 
Vorteil hat, dafi eine Beschrankung auf nur die besten Pfade 
des Baumes vorgenommen werden kann und dadurch we- 
sentlich weniger Polynome evaluierl werden miissen. Nfor- 65 
zugsweise sind diese Teil-Klassifikatoren als binare Poly- 
nom-Klassifikatoren ausgefuhrt Vorteilhafterweise wird in 
an sich bekannter Art vor der Durchfuhrung der Vektor- 
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quantisierung die Dimension der Merkmaisvektoren mittels 
einer linearen Diskriminanz- Analyse reduziert. 

Die Erfindung ist nachfolgend noch anhand eines Erken- 
nungssystems zur Erkennung gebundener Schrift veran- 
schaulicht. Ein solches Erkennungssystem ist beispielsweise 
in [KCGM 93] beschrieben und fur Einzelheiten eines sol- 
chen beispielhaften Erkennungssystems wird auf diese Lite- 
raturstelle verwiesen. 

Ausgehend von einem binaren Pixel-Bild einer handge- 
schriebenen Buchstaben- oder Zahlenfolge besteht eine we- 
sentliche Aufgabe beim Einsatz eines HMM-Erkenners 
darin, aus dem Binar-Bild eine Folge von Vektoren als Ein- 
gangsgroBen des HMM-Erkenners zu erzeugen. Eine solche 
Vorverarbeitung kann beispielsweise den Ubergang von der 
Pixel-Darstellung zu einer Kontur-Beschreibung umfassen, 
an den sich dann Normierungsschritte, wie Schreiblinien- 
schatzung, Aufrichtung schrager Schrift, Drehung des 
Schriftbilds und Ubergang zu einer Skelett-Darstellung an- 
schheBen konnen. Solche VorverarbeitungsmaBnahmen sind 
in verschiedener Weise bekannt und gebrauchlich. Eine de- 
tailliertere Darstellung der Vorverarbeitungs-MaBnahmen 
eines solchen Erkennungssystems ist beispielsweise in 
[CGM 93] beschrieben. DieEinstellung eines HMM-Erken- 
ners ist komplex und, da in verschiedenen Ausfuhrungen 
aus dem Stand der Technik hinreichend bekannt, an dieser 
Stelle nicht im Detail beschrieben. Zur Erzeugung von 
Merkmaisvektoren aus dem vorverarbeiteten Bild wird bei- 
spielsweise ein schmaler Fensterausschnitt in angenomme- 
ner Schreibrichtung schrittweise uber das Schriftbild bewegt 
und bei jedem Schritt werden aus dem Fensterinhalt Merk- 
male extrahiert, die in ihrer Gesamtheit einen Merkmalsvek- 
tor bilden, Diese Vorgehensweise wird sowohl in einer Trai- 
ningsphase auf Schriftbilder bekannten Inhaltes als auch in 
einer nachfolgenden Erkennungsphase auf Schriftbilder un- 
bekannten Inhaltes angewandt. 

Bei ausreichend groBer Anzahl von Trainingsmu stern zei- 
gen die aus diesen Mustern gewonnenen Merkmaisvektoren 
Anhaufungen, sogenannte Cluster, im mehrdimensionalen 
Raum der Merkmaisvektoren. Diese Cluster konnen auf an 
sich bekannte Weise, beispielsweise nach dem bekannten 
und uberwiegend angewandten LBG-Algorithmus analy- 
siert werden. 

GemaB einem aus dem Stand der Technik bekannten vor- 
teilhaften Vorgehen werden bei Bewegung des Fensteraus- 
schnitts nicht nur die statischen Merkmale einer Fensterpo- 
sition, sondem auch die Differenzen der Merkmale zu be- 
nachbarten Fensterpositionen bestimmt und weiterverarbei- 
tet, was zu einem entsprechend hoherdimensionalen Merk- 
malsvektor fuhrt. Die nachfolgenden Ausfuhrungen gelten, 
ohne daB es jeweils eines gesonderten expliziten Hinweises 
bedarf, auch fiir solche und ahnliche Varianten der Merk- 
malsgewinnung. 

In einer ersten Trainingsphase des HMM-Erkenners wer- 
den auf der Basis der zuvor erfolgten zustandsunabhangigen 
Vektorquantisierungstrainings (ein oder mehrere sogenannte 
Codebooks) und unter Zugrundelegens vorgebbarerStruktu- 
ren der HMM-Modelle fiir die moglichen Objektklassen 
mogliche Pfade durch die Strukturen und Zuordnungen ein- 
zelner Merkmaisvektoren zu Zustanden der HMM-Modelle, 
z. B. unter Anwendung des sogenannten Forward-Back- 
ward- Verfahrens, bestimmt und dabei die Koeffizienten der 
HMM-Modelle ermittelt. In diesem Rahmen wurden auch 
fur die verschiedenen Zustande, die die Symbole eines ein- 
zelnen neuen zustandsabhangigen Codebooks bilden, Mo- 
mentenmatrizen aus den zuzuordnenden Merkmaisvektoren 
bestimmt. Die Momentenmatrizen werden zur Schatzung ei- 
ner linearen Diskrirninanz-Transfonnations-Matrix heran- 
gezogen, die wiederum zur Reduzierung der Dimension der 
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Merkmalsvektorcn dient. Diese Verfahrensschritte sind an 
sich bekannt und gebrauchlich und im Detail in (Fuk 90) be- 
schrieben. 

Aus den Momentenmatrizen konnen bei Einsatz eines 
Vektorquantisierers auf der Basis angenommener statisti- 
scher Verteilungen, z. B. GauB- Verteilungen, die Parameter 
der Verteilung wie z. B. Schwerpunkt und Kovarianz ermit- 
telt werden. Sole he angenommenen statistischen Verteilun- 
gen nahern jedoch die tatsachlichen Verteilungen haufig nur 
unzureichend an. 

Gemafi der vorliegenden Erfindung wird mit dem Einsatz 
eines Polynom-Klassifikators ein ganzlich anderer Weg be- 
schritten, bei welchem a priori keinerlei Annahmen iiber 
eine bestimmte staustische Verteilung gemacht werden. Die 
Koeffizienten des Polynom-Klassifikators werden auf der 
Basis der in der Trainingsphase bestimmten Merkmalsvek- 
toren ermittelt. 

Vorteilhafterweise werden dabei anstelle der Merkmals- 
vektoren die bereits zuvor gebildeten Momentenmatrizen 
herangezogen und so der bei der Koeffizientenernuttlung 
ohnehin erforderliche Schritt der Bildung dieser Matrizen 
aus den Merkmalsvektoren vermieden. Daruber hinaus kann 
auf diese m Weg vorteilhafterweise die explizite Kennzeich- 
nung der Klassenzugehorigkeit der einzelnen Merkmalsvek- 
toren umgangen werden, da die Momentenmatrizen ohnehin 
zu bestimmten HMM-Zustanden gehoren und diese im spa- 
teren Vektorquantisierer auf Polynomklassifikatorbasis ge- 
rade die zu erzeugenden Symbole darstellen. 

Aus Griinden des Rechenaufwands ist es auch hier vor- 
teilhaft, mit der gegentiber dem urspriinglichen Merkmals- 
vektor-Raum reduzierten Dimension zu arbeiten, indem die 
lineare Diskriminanz-Transformation auf die Merkmalsvek- 
torcn bzw. die Momentenmatrizen angewandt wird. 

Die Polynomstruktur wird vorzugsweise als vollstandige 
Struktur vorgegeben, kann aber auch zur Reduzierung des 
Rechenaufwands ausgediinnt werden und bleibt wahrend 
der Trainingsphase unverandert. Fur die Diskriminanten- 
Funktion d(v) des Polynoms zu den verschiedenen Objekt- 
klassen gilt 

d(v) = A T x(v) 

mit A als Koeffizientenmatrix und x(v) als Funktion fur eine 
vektorielle Abbildung des urspriinglichen Merkmalsvektors 
v auf die Polynomstrukturliste x. 

Fur jeden Knoten des Pfad-Verzweigungsbaums (trellis) 
kann die Wahrscheinlichkeit, daB ein Merkmalsvektor ei- 
nem bestimmten Zustand eines HMM-Modells zuzuordnen 
ist, bestimmt werden, was zu neuen Momentenmatrizen E 
{xx T } und E {xy T } mit y als Symbolklassen-Vektor fuhrt, 
aus denen die Koeffizientenmatrix nach 

A=E{xx T r l E{xy T } 

bestimmt werden kann. Eine detaillierte Beschreibung die- 
ser und weiterer Aspekte von Polynom-Klassifikatoren gibt 
[Sch 96]. 

Die Verwendung eines Polynom-Klassifikators bietet, zu- 
mindest bei Verwendung des kleinsten mitderen Fehlerqua- 
drats als Optimierungskriterium, den Vorteil einer mathema- 
tisch geschlossenen Losung ohne Iterationen. 

Zur Verringerung des Rechenaufwands wird die Vektor- 
quantisierung vorzugsweise nicht mittels eines einzigen ein- 
stufigen Polynom-Klassifikators, sondern mehrstufig mit 
sukzessiver Verzweigung in aufeinanderfolgenden Stufen 
unter Einsatz mehrerer Polynom-leil-Klassifikatoren nach 
Art einer Baumstruktur durchgefuhrt Die Teilklassifikato- 
ren sind insbesondere vorteilhafterweise als binare Poly- 



nom-Klassifikatoren ausgefuhrt. 

Die Einstellung des Polynom-Klassifikators in einer Trai- 
ningsphase wird im Regelfall gegenuber einem \fektorquan- 
tisierer mit angenommener statistischer Verteilungsfunktion 

5 in dieser Trainingsphase mit einem hoheren Rechenaufwand 
verbunden sein. Dieser fallt jedoch nur einmal in der Trai- 
ningsphase an. Der Rechenaufwand in der spateren Erken- 
nungsphase ist nicht oder nur unwesentlich hoher im Ver- 
gleich zur Vektorquantisierung auf der Basis statisdscher 

to Verteilungsfunktionen. Bei Durchlaufen des Verzweigungs- 
baums der Teil-Klassifikatoren kann durch Abbrechen unbe- 
deutender Pfade (pruning) der Verarbeitungsaufwand bei 
der Vektorquandsierung weiter reduziert werden. 

Die verbesserte Beschreibung der tatsachlichen Vertei- 

15 lung im Merkmalsvektor-Raum durch den Polynom-Klassi- 
fikator fuhrt nach ersten Untersuchungen gegenuber einer 
angenommenen Normal verteilung zu einer signifikanten 
Verringerung der Fehlerrate, bei sonst gleicher Einstellung 
des Erkennungssystems beispielsweise zu einer Fehlerrate 

20 von 5,6% gegenuber 6,3% bei angenommener Normalver- 
teilung. 
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Patentanspriiche 

45 l. Mustererkennungsverfahren auf der Basis von Hid- 
den-Markov-Modellen, bei welchem Merkmalsvekto- 
rcn mittels einer Vektorquandsierung in Symbol- Vek- 
toren transformiert werden, dadurch gekennzeichnet, 
daB die Vektorquantisierung mittels eines Polynom- 
50 Klassifikators ohne Annahme iiber im zustandsabhan- 
gigen Merkmalsraum vorliegende staustische Vertei- 
lungen durchgefuhrt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeich- 
net, dafi die Vektorquantisierung in mehreren Stufen 

55 verzweigt erfolgt wobei einzelne Polynom-Teil-Klassi- 
fikatoren die Knoten der Verzweigung reprasentiercn. 

3. Verfahren nach Anspruch 2, dadurch gekennzeich- 
net, daB die Polynom-Teil-Klassifikatoren binare Poly- 
nom-Klassifikatoren sind. 

GO 4. Verfahren nach einem der Anspriiche 1 bis 3, da- 
durch gekennzeichnet, daB die Dimension der Merk- 
malsvektorcn reduziert und die Vektorquantisierung 
anhand der dimensionsreduzierten Merkmalsvektorcn 
durchgefuhrt wird. 
65 5. Verfahren nach einem der Anspriiche 1 bis 4, da- 
durch gekennzeichnet, daB die Koeffizienten des Poly- 
nom-Klassifikators aus den in einer Trainingsphase er- 
mittelten Merkmalsvektorcn oder daraus abgeleiteten 
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GroBen geschatzt werden. 

6. Verfahren nach Anspruch 5, dadurch gekennzeich- 
net, daB in einer Trainingsphase des HMM-Erkenners 
aus den Merkmalsvekloren Momenten-Matrizen gebil- 
det und diese Momenten-Matrizen auch zur Schatzung 
der Koeffizienten des Polynom-Klassifikators, bzw. der 
Polynom-Kiassifikatoren eingesetzt werden. 
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